AI023
Giới thiệu về Lập trình Triton
Cài đặt Môi trường và Xác định Các Chặn Lọc GPU
Mục tiêu Học tập
- Cấu hình và xác minh một môi trường phát triển GPU sẵn sàng sản xuất bằng CUDA và ROCm.
- Thực hiện phân tích hiệu suất toàn hệ thống để lập bản đồ thời gian thực thi kernel và mức sử dụng tài nguyên.
- Phân biệt giữa các kernel bị giới hạn bởi tính toán và các kernel bị giới hạn bởi bộ nhớ bằng cách sử dụng các chỉ số và mô hình roofline.
- Chẩn đoán và giảm thiểu độ trễ truyền dữ liệu qua PCIe và độ trễ từ máy chủ đến thiết bị.